1. トップ
  2. トレンド
  3. AIの主役交代、CNNからトランスフォーマーへ ほか ニュースダイジェスト 3-14-2022

AIの主役交代、CNNからトランスフォーマーへ ほか ニュースダイジェスト 3-14-2022

ここ最近、個人的に気になった世界のテクノロジー関連ニュースを集めました。この記事は、会員向けの限定公開記事です。未確認の情報や個人的見解を含みますので、一般公開はご遠慮くだい。

◎AIの主役交代、CNNからトランスフォーマーへ

10年前にAIブームが起こったのは、CNN(畳み込みニューラルネットワーク)と呼ばれるAIが画像認識コンテストでぶっち切りの優勝をはたしたことがきっかけだった。
簡単に言ってしまえば、CNNは次のような手順で画像を認識する。まずは、最初の層では顔写真の中の「線」や「点」「エッジ」などを認識。次に真ん中の層では、それらを組み合わせて「鼻」や「口」といった顔の部品を認識する。そして最後のほうの層では、それらの顔の部品を組み合わせ「顔」を認識する。小さなものの認識を積み上げている、このCNNのやり方が非常にうまくいき、AIと言えばCNNのことを指すほどCNNはAIの主流技術となった。
ただCNNは主に画像認識が得意な技術。なので言語処理では別のAI技術がいろいろと開発された。そのうちの1つが2017年に開発されたトランスフォーマーと呼ばれる技術だ。トランスフォーマーは、それまでの言語処理技術が単語の前後の文脈から単語の意味を推測するのに対し、文書の中のすべて単語の関係性から1つ1つの単語の意味を理解するという手法の技術だ。
例えば「父親は塾の門の前で息子を待っていた。出てきた息子に対し、彼は『試験の結果はどうだった』と聞いた」という文章だと、以前の技術なら「彼」が「父」なのか「息子」なのかうまく判断できなかった。「彼」の直前に「息子」という単語が出てくるので、「彼」を「息子」のことだと判断するかもしれない。しかしトランスフォーマーは、文書の最初の単語から最後の単語まで、すべての単語の関係性を把握するので、「彼」が「父親」であると判断できるのだという。
別の言い方をすると、CNNは部品の認識を積み上げて全体を理解しようというボトムアップ方式であるのに対し、トランスフォーマーはまず低い解像度で全体像をつかみ、徐々に解像度を上げていくトップダウン方式だということになる。
トランスフォーマーが登場するまで、AIは言語処理の分野で際立った成果を上げることができなかった。ところがトランスフォーマーの登場で、ここ2、3年の言語処理AIの発展には目を見張るものがある。
例えば一部の一般ビジネスマンの間にもその名前を知られるようになったGPTー3は、Generative Pre-trained Transformer 3の略でトランスフォーマーの一種である。GPTー3は、人間が書いたのと見分けがつかないような文章を自動生成できることから、今後いろいろな領域に応用されるものと見なされている。
一方で研究者の間では、トランスフォーマーを言語処理以外の領域にも応用できないかという研究が活発になっている。画像認識の領域でもトランスフォーマーは成果を上げ始めており、今年初めの画像認識のコンテストでは1位がCNNとトランスフォーマーを合体させたAIで、2位以下は画像認識用に開発されたトランスフォーマーが占めた。純粋なCNNは10位にも入れなかったという。グーグルの研究者Neil Houlsby氏は「そう遠くない未来にCNNは、画像認識用トランスフォーマーに取って代わられる可能性が高い」と語っている。
また1つのトランスフォーマーで、複数のデータを同時に処理してしまおうという研究も進んでいる。マルチモーダル処理と呼ばれる手法で、発話者の口もとを画像認識すると同時に、音声を言語認識。そうすることで、発話者が何を言っているのかの理解が格段に正確になると考えられている。YouTube動画の自動字幕も、発話者の顔の動画と音声の同時認識で、より正確なものになることだろう。
1種類のデータでは、どうしても精度が一定レベルを超えないことがある。自動運転にように、精度が99%だったとしても1%のミスが人命にかかわるために、実用化できないケースもあるだろう。このようなこれまでAI活用が現実的でなかった領域でも、複数のデータを合わせることで活用の道が見えてくるかもしれない。トランスフォーマーの登場で、AI活用がさらに広がる可能性が出てきた。
情報ソース

◎人の脳の判断結果を組み込んだAI

人間の脳とAIって得手不得手が違うので、両方を合体させればさらに高度な脳になるはず。ということで合体の研究がいろいろ行われているんだけど、これはカリフォルニア大学の実験。
動物やイス、自転車など、いろいろな写真を歪めて、元の物体が何だかんだよく分からないようにした写真のデータセットを、人間と画像認識AIに渡して、元は何の写真かを推測させる実験を行った。またそれぞれの推測結果に、どれだけ自信があるかも表明してもらった。結果は、ある写真は人間のほうが正答率が高く、別の写真ではAIの方が正答率が高かった。やっぱり人間とAIでは、見ているところが違うんだと思う。
そしてこの人間とAIの回答結果をベイジアン・フレームワークというAIのアルゴリズムで合体して解析したところ、人間単独、AI単体で出した正答率よりも高い結果になったという。
このほかにも人間の脳とAIを合体させれば、AIの精度が上がる領域っていろいろあるはず。AIが人間を駆逐するのではなく、AIと人間って協働していくようになるんだろうな。
情報ソース

◎今回のメタバースブーム、前回と何が違う?

長年IT業界に関係してきた人間からすると、今回のメタバースブームって以前あったセカンドライフやアメーバピグのような仮想空間ブームと何が違うのだろう。そう思っていろいろな人に質問してみたんだけど、ただ単純に多くの人は年齢的なこともあって、セカンドライフやアメーバピグに触れたことがない、ということが分かった。初めての経験なんで「これはすごい!」となっている人がどうやら大半のようだ。
ただ一人だけ面白い意見を聞いた。その人によると、セカンドライフの時との最大の違いは、Metamaskのようなウォレットがログイン認証のプラットフォームとして存在すること、NFTなどに代表されるトークンエコノミーがメタバースの上に発達するであろうこと、そしてDAOのようなメタバースにフィットする法人格がそこにおける活動の主体となるであろうこと、などにあるという。つまり、メタバースが単なるちょっとしたヴァーチャルな遊び場ではなく、本当に社会を動かすインフラのひとつとして大いに発展することが期待できることが、前回までのブームとは異なる点だと言う。
社会インフラに発展する基盤技術はできた。あとは、それをどう使いやすく実装するかなんだと思う。シリコンバレーの人たちの熱気からして、おもしろいアプリケーションがいろいろ出てきそうな気はするけど、まあまだしばらく様子見かも。
◎米国人、カーボンニュートラルは賛成だけど、脱石油は反対
米リサーチ大手Pew Research Centerによる米国民の意識調査。2050年までにカーボンニュートラルを目指すことには69%の人が賛成しているが、化石燃料を完全にやめることに賛成する人は31%しかいない。石油で儲けている州も多いし、自分の生活を考えると急激な変化はのぞましくないということなんだろうな。
じゃあ、どうやってカーボンニュートラルを目指すんだろうw
情報ソース

◎注目のロケットベンチャーRelativity Space社

米大富豪Mark Cuban氏が投資するロケットベンチャーRelativity Space社は3Dプリンターでロケットを作ってるらしい。同社の推定時価総額はイーロン・マスク氏率いるSpaceXに次いで2番目らしい。
今までは大きな物体を作ろうとしてら、小さな部品を組み合わせたり、貼り付けたりしないといけなかった。3Dプリンターなら張り合わせなくても原材料を積み上げていくだけで作りたい形を作れるので、接合部分がなくて強度が増すのかも。
情報ソース

◎3Dプリンターでロケット。コスト8割減

中国のスタートアップSpaceTai社の話。ほんとか?
情報ソース

◎3Dプリンターで作った触媒が加熱を防ぐ

超音波ジェットの問題は加熱。でも3Dプリンターで作った触媒を使えば、加熱を防ぎ、時速3800マイルでの飛行も可能だという。この触媒は、熱量管理が必要ないろいろな産業に利用できるという。
情報ソース

◎DNAをデータストレージにする研究

過去5年間で人類が作り出したデータの容量は、人類がそれまでの500万年間で作り出したデータ容量を超えると言われている。さらにデータ生成のペースは加速する一方で、これ以上のペースでデータが増えればストレージが足らなくなるんじゃないかって言われている。
そこで検討されているのがDNAにデータを蓄積する手法。なんせ人間の設計図を0.01ミリぐらいに収めることができるのだから。しかも厳しい環境の中でも破壊されることがない。
具体的には、Beckman Institute for Advanced Science and Technologyの研究者らのチームが、DNAの4つの塩基に、あと7個の塩基を加えることで、より大きな容量のストレージを作ろうとしているらしい。
情報ソース

◎ロボットが外科手術に成功

離れた場所から医師がロボットアームを遠隔操作して外科手術をするという例はこれまでにもあったけど、ジョンズ・ホプキンス大学のKreiger医師によると、ロボットに最初に命令しておくだけで、あとはロボットが自動で腹腔鏡手術を行ったのは初めて、だという。
情報ソース

◎暗号資産に関する初の大統領命令

米バイデン大統領が、「米国で史上初の政府全体に関わるデジタル資産関連の」大統領命令を出した。これまで暗号資産に関する米政府の取り組みが付け焼き刃的だという批判があったので、政府として方向性を示したらしい。どこの省庁がどんなことをする、みたいな大枠の方針が書かれているだけで、何も具体的な話は含まれていないもよう。中央銀行によるデジタル通貨の発行も検討されるのだとか。
国としてしっかり方針を示してほしいという民間からの突き上げがあったんだろうな。日本は(以下省略)。
情報ソース

◎CRISPRとAIタンパク質で遺伝子活性化

DNAには含まれているんだけど未活性の遺伝子を、遺伝子編集技術CRISPRとAIがデザインしたタンパク質の両方を使うことで活性化できる、という論文が発表された。
情報ソース

◎戦時の情報戦とテック大手の責任

ウクライナの一件をみても、今の戦争って国際世論を勝ち取るための情報戦の側面が強い。そうなってくるとグーグルやフェイスブックといったテック大手の責任が重大になってくる。どの情報を流して、どの情報をフェイクニュースとして規制するのか。国際企業なのに、米国政府寄りの情報操作していいのか。言論や報道という民主主義の根幹に関わる大事な役割を、理系の20代のエンジニアたちが担っているって、よく考えれば恐ろしい話。
情報ソース

◎「SNSは若者の精神状態に責任を持て」米大統領演説

米バイデン大統領は、一般教書演説で「ソーシャルメディア事業者が収益目的で行なっている、若者のメンタルヘルスに危害を与えかねない実験に対し、責任を取ってもらうつもりだ」と語ったらしい。
米国でのテック大手に対する風当たりは厳しくなる一方。日本では「どうして日本企業は、米テック大手みたいになれなかったのか」という議論が中心だけど。
インスタグラムの影響で10代の女性の1/3が、スタイルにコンプレックスを持つようになったのだとか。

◎Twitterが事実確認ボランテイアプロジェクト

21世紀の最強の軍事兵器はフェイクニュース。米大統領選、ワクチンときて今はウクライナ。
敵国の民主主義を機能不全にさせるためにフェイクニュースが作られる。フェイクニュースがリツイートされるのを見て、金になるからとフェイクニュースを作る人も現れている。SNSは過激な情報の方がアクセスを集めるので、余計に過激な情報をレコメンドする。この悪意、金儲けのメカニズムで、世論の分断が進んでいる。もはや何を信じていいのか分からない状態。
こうした事態を打破しようと、ころからいろいろな試みが出てくると思う。まずは今回のTwitterがやってるようなボランティアに頼る仕組み。次にAIを使ってフェイクニュースを見分ける仕組みも出てくると思う。最終的には、ブロックチェーンでニュースソースを明らかにする仕組みに落ち着くような気がする。

◎Amazonがリアルストア68店舗を閉鎖

コロナ禍ということもあって、Amazon Booksなどのリアル店舗のうち、業績の悪い68店舗の閉鎖を進めているらしい。やっぱりリアルは難しいのかな。
情報ソース

◎ドイツは2035年までに100%再生可能エネルギーに

100%ってすごいなあ。結構急速な社会変化になりそう。ウクライナを見ても、原発には頼ってられない感じもあるしね。
情報ソース

◎新型コロナの治療方法続々

新型コロナのウイルスのことがようやく分かってきたみたい。治療方法が次々と開発されつつあるようだ。それにしてもアメリカ人の43%がコロナにかかったって、すごいなあ。
情報ソース

 

◎米カリフォルニア州で自動運転タクシーに初の認可

カリフォルニア州がWaymoとCruiseの2社に対して、自動運転タクシーの事業許可を出した。サンフランシスコと隣のサンマテオカウンティで。ただし念のため運転手は同乗する。
うーん、運転手が乗らないといけないのなら、あんまり意味ないなあ。まあ段階的な解禁だろうけど。
情報ソース

◎マウスの若返りが可能に

細胞を若い状態に設定し直すことで、中高年のマウスの若返りが可能であることが分かったらしい。不老不死の時代に向かってるのかな?
情報ソース
著者
湯川鶴章

AI新聞 編集長

AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。